查看原文
其他

轻松理解bin、hex、axf和elf文件格式

strongerHuang 嵌入式专栏 2022-09-10

关注+星标公众,不错过精彩内容

作者 | strongerHuang

微信公众号 | 嵌入式专栏


在嵌入式软件开发中,bin、hex、axf和elf这四种格式的文件很常见。


之前我分享的STVPST-LINK UtilitySTM32CubeProg这些下载编程工具的时候,都用到了bin、hex格式的文章。


作为普通嵌入式软件开发者,可能只知道如何使用他们,并不会在意这些文件里面具体是什么内容。


嵌入式专栏

0

总述
bin 和 hex 大家都不陌生,就是我们下载到芯片的程序文件。

bin文件只是单纯的程序数据,hex除程序数据之外还有一定格式数据。

而 axf 和 bin、 hex 同样也属于程序文件,差别在于 axf 具有更多的调试信息。

用一个表格来区分bin、hex和axf三者的关系:
binhexaxf
程序数据程序数据程序数据

地址、类型、校验等标记信息地址、类型、校验等标记信息


调试信息


你会发现,同样一段代码,编译生成的bin文件最小,axf最大。


在嵌入式Linux中还有一种文件 ELF(Executable and Linkable Format,可执行与可链接格式)也算是一种程序文件,这种文件包含信息更多、更复杂。


下面分别来描述bin、hex、axf和elf这四种格式文件。

嵌入式专栏

1

bin文件
bin 是 binary 的缩写,直白的翻译即为二进制文件,在这里理解为可执行的机器代码(程序)文件,因为计算机存储只有 0 和 1。

当然,bin 除了是程序文件的含义,还有其他含义,比如虚拟光驱文件,我们下载的一个 Windows 镜像文件后缀就可能是bin。

bin 相对于hex、axf是一种最简单的程序文件,只有程序数据,程序文件有多大,程序也就多大。

因此,你下载 bin 程序文件的时候,必须要设置起始地址,比如:通过STM32 ST-LINK Utility工具下载bin文件:


而hex则不可修改(文件中包含地址信息):


嵌入式专栏

2

hex文件
hex 格式文件由 Intel 制定的一种十六进制标准文件格式,是由编译器转换而成的一种用于下载到处理器里面的ASCII文本文件。

1.解释
维基百科解释

https://en.wikipedia.org/wiki/Intel_HEX

Intel HEX is a file format that conveys binary information in ASCII text form. It is commonly used for programming microcontrollers, EPROMs, and other types of programmable logic devices. In a typical application, a compiler or assembler converts a program's source code (such as in C or assembly language) to machine code and outputs it into a HEX file. The HEX file is then imported by a programmer to "burn" the machine code into a ROM, or is transferred to the target system for loading and execution.

Keil官网解释

https://www.keil.com/support/docs/1584/

The Intel HEX file is an ASCII text file with lines of text that follow the Intel HEX file format. Each line in an Intel HEX file contains one HEX record. These records are made up of hexadecimal numbers that represent machine language code and/or constant data. Intel HEX files are often used to transfer the program and data that would be stored in a ROM or EPROM. Most EPROM programmers or emulators can use Intel HEX files.


2.格式

hex行格式:

:BBAAAATT 【D···D】CC


其中:

代表行开始,固定为冒号:

BB代表Bytes,数据长度

AAAA代表Address,地址

TT代表Type,数据类型(标识)

D···D代表Date,数据

CC代表CheckSum,校验和


说明:

BB数据长度,也就是D···D这个字段的数据长度;


AAAA地址,起始地址、偏移地址,根据数据类型(TT)有关;


TT数据类型(标识):

  • 00:数据标识

  • 01:文件结束标识

  • 02:扩展段地址

  • 04:线性地址

  • 05:线性开始地址

(地址代表高16位地址,也就是要向左移16bit)


CC校验和计算公式:

CheckSum = 0x100 - (Sum & 0xFF)


3.例子说明

不同数据类型个行数据略有差异,先再看下00(数据类型)的格式:


一个常见hex文件:

:020000040800F2:1000000000040020B1010008FD020008BD02000844:10001000F902000801020008350400080000000091:1000200000000000000000000000000021030008A4···省略数行:100470000000024084040008000000200004000086:040480004804000824:040000050800019955:00000001FF


1.04类型:线性地址行

:020000040800F2
02:数据长度,这里是(0800)地址的2字节长度;

0000:偏移地址,这里数据其实无效;

04:线性地址数据类型;

0800:线性起始地址,左移16位,即:0x0800 0000;

F2:校验和

F2 =  0x100 - (0x02 + 0x04 + 0x08);


比如,修改起始地址为0600:


2.00类型:数据行

:1000000000040020B1010008FD020008BD02000844
10:数据长度,这里是16字节(程序)数据的长度;

0000:偏移地址,数据第一行偏移0000地址,第二行就是偏移0010,第二行就是偏移0020,依次偏移到FFF0;
如果偏移到FFF0,则会重新下一个起始地址,一段程序你就明白了:
:10FFD000D0C5CFA20D0A00003052010810B50A4862:10FFE00002F0FEFC09A002F0FBFC14A002F0F8FCF9:10FFF0001EA221A123A002F0F3FC2CA002F0F0FC31:020000040801F1:10000000394802F0EDFC10BD3C5301080D0A2A20CE:1000100020202020202020202020202020202020E0:100020002020202020202020202020414756D6C7F5

00:线性地址数据类型;

00040020B1010008FD020008BD020008:程序数据,就是bin文件里面的纯程序数据;

44:校验和

44 =  0x100 - (0x10 + 0x04 + 0x20 + 0xB1 + 0x01 + 0x08 + 0xFD + 0x02 + 0x08 + 0xBD + 0x02 + 0x08 + 0x44) & 0xFF;


3.01类型:文件结束行

:00000001FF
00:数据长度;

0000:偏移地址,这里数据其实无效;

01:代表文件结束

FF:校验和


这里代表hex文件结束了,有些公司为了使hex传输(下载)更可靠,或通过工具(或命令在)结束行后面追加校验信息,一般远程升级会考虑更多校验信息(后期抽时间讲述一下远程升级)。


更多细节内容,可以参看链接:
https://www.keil.com/support/docs/1584/
https://www.kanda.com/blog/microcontrollers/intel-hex-files-explained/
(公号不支持外链接,请复制链接到浏览器打开)

看到这里,我相信很多人都能写一个脚本工具,让hex转为bin文件(后面抽空给大家讲述一下hex和bin转换的工具)。


嵌入式专栏

3

axf文件
axf格式文件是针对ARM编译器的一种格式文件,它是由 ARM 编译器产生。

axf文件除了包含程序数据(bin)和地址(hex)等数据之外,还包含调试信息。

axf文件内的调试信息附加在程序文件中,有助于分析和调试。

axf文件的调试信息作用:
  • 可将源代码包括注释夹在反汇编代码中,这样我们可随时切换到源代码中进行调试。

  • 还可以对程序中的函数调用情况进行跟踪(通过Watch & Call Stack Window查看)。

  • 对变量进行跟踪(利用Watch & Call Stack Window)。


当然,axf文件调试信息的包含的内容有限,并非所有源码(及注释)相关信息都会包含在其中,想要有效调试,还是需要结合源代码工程进行调试。


嵌入式专栏

4

elf文件
ELF:Executable and Linkable Format,可执行与可链接格式。

elf是一种用于二进制文件、可执行文件、目标代码、共享库和核心转储格式文件。是UNIX系统实验室(USL)作为应用程序二进制接口(Application Binary Interface,ABI)而开发和发布的,也是Linux的主要可执行文件格式。
---来源百度百科


elf文件和bin、hex、axf文件同样属于可执行文件这一类,但是他们之间差异还是很大,elf文件包含的信息更多,也更复杂。

elf格式文件由四部分组成:

  • ELF header:ELF头

  • Program header table:程序头表

  • Section:节

  • Section header table:节头表



ELF header:描述整个文件的组织。

Program Header Table: 描述文件中的各种segments,用来告诉系统如何创建进程映像的。

Section:是从运行的角度来描述elf文件,sections是从链接的角度来描述elf文件,也就是说,在链接阶段,我们可以忽略program header table来处理此文件,在运行阶段可以忽略section header table来处理此程序(所以很多加固手段删除了section header table)。从图中我们也可以看出,segments与sections是包含的关系,一个segment包含若干个section。

Section Header Table: 包含了文件各个segction的属性信息。

这四部分内容在《ELF详细描述》文章中有详细描述,需要更进一步了解,可以进入文中了解。

------------ END ------------


后台回复『文件格式』『嵌入式软件基础知识』阅读更多相关文章。


关注微信公众号『嵌入式专栏』,底部菜单查看更多内容,回复“加群”按规则加入技术交流群。


点击“阅读原文”查看更多分享,欢迎点分享、收藏、点赞、在看。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存